بهسازی گفتار با استفاده از ویونت

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
  • نویسنده سمیرا مغانی
  • استاد راهنما حسین مروی
  • سال انتشار 1391
چکیده

بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. تاکنون چندین روش در زمینه بهسازی گفتار نویزی ارائه شده است. روش پیشنهادی ما در این پایان نامه، شبکه عصبی موجک (ویونت) می باشد. این روش، مدلی مبتنی بر تلفیق شبکه عصبی با تبدیل موجک می باشد و به عنوان جایگزین مناسب در شبکه های عصبی پسخورد جهت تخمین و تقریب توابع غیرخطی اختیاری پیشنهاد می شود. در شبکه استاندارد پسخورد تابع فعال سازی نرون لایه پنهان یک تابع سیگموئید است. حال آنکه شبکه های عصبی موجک توابع موجک را به عنوان توابع فعالسازی نرون های لایه پنهان از شبکه پسخور مورد استفاده قرار میدهند. در روش پیشنهادی دو حالت برای دسترسی به نویز در نظر گرفته شد. حالت الف، حالتی است که دسترسی مستقیم به نویز محیط وجود دارد و حالت ب، حالتی است که از تخمین نویز استفاده کرده ایم. روش پیشنهادی برای تخمین نویز، استفاده از تبدیل موجک می باشد. موجک استفاده شده در این مرحله دابیشز 5 (db5) می باشد. روش پیشنهادی برای دادگان فارسی پیاده سازی شده است و برای ارزیابی و عملکرد آن از سه معیار سیگنال به نویز، سیگنال به نویز قطعه ای وlog likellihood ratio (llr) استفاده شده است. در نهایت روش پیشنهادی با شبکه عصبی و ترکیب شبکه عصبی با موجک و روش موجک مقایسه شده است. بررسی نتایج و آزمایشات نشان دهنده عملکرد قابل قبول روش پیشنهادی است.

منابع مشابه

بهسازی گفتار با استفاده از گذرای سیگنال

در دهه های گذشته تحقیقات گسترده ای برای بهبود فهم گفتار نویزی انجام شده است. این تحقیقات می تواند به 2 گروه تقسیم شود :روش های کاهش نویز و بهبود گفتار یا مقاوم سازی گفتار. گروه اول شامل تکنیک هایی است که نویز ترکیب شده با گفتار را با کمترین تاثیر روی فهم گفتار کاهش می دهد. این روش ها در شرایطی که ماهیت نویز نامعلوم باشد به خوبی کار نمی کنند. این گروه از روش های بهسازی سیگنال گفتار، روش کاهش نوی...

15 صفحه اول

بهسازی گفتار تک‌کاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale

بیشتر روش‌های بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه می‌دهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد می‌شود که در آن از یک توزیع دنباله - سنگین به نام(tls)  t location-scale برای مدل‌کردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی به‌عنوان مدل قطعی استفاده شده است. در مدل نمایی به‌کاررفته، تخمین ...

متن کامل

بهسازی گفتار با استفاده سیستمهای gsc

نویز و انعکاس مهمترین عوامل محیطی موثر در تخریب سیگنال گفتار محسوب می شوند. هدف از این تحقیق بررسی یکی از پرکاربردترین ساختارهای بهسازی گفتار با نام حذف کننده لوب های فرعی (gsc) در مقابله با نویزهای جهت دار محیط است.به دنبال کاربردهای زیاد ساختار gsc برای حذف نویزهای جهت دار در حوزه سیگنال های باندباریک (همچون رادار، سونار و ...)، استفاده از این ساختار با هدف مقابله با نویزهای باندوسیع موجود بر...

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...

متن کامل

بهسازی وفقی سیگنال گفتار در محیط‌های واقعی با استفاده از ساختار ترکیبی مبتنی بر شکل‌دهنده‌های پرتو و فیلتر پسینه

تنوع میدان‌های نویزی حاکم بر محیط‌های واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه می‌کند. لذا، داشتن یک شناخت اولیه از میدان‌های نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب می‌شود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبط‌شده در شرایط واقعی، به ارزیابی میدان‌های نویزی پایین‌گ...

متن کامل

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023